iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 11
1
AI & Data

飛哥與小博的30天-統計與機器學習成長日記系列 第 11

[DAY 11] 章節2-7: 前往新加坡-區分三種回歸使用時機(解說)

  • 分享至 

  • xImage
  •  

人物介紹: B董

英文名字是Aron,所以飛哥也會叫他阿倫兄,先前在公司表現不錯,近期獲得升遷的機會。幾年前,飛哥跟B董的幾位朋友一起去爬雪山,當時飛哥上山時身體不適,因此B董幫忙揹了背包減輕他的負擔,才順利登上山峰,也因為這次的幫助讓兩人結識成為好朋友。

2-7 前往新加坡

今天是個下雨天,窗外飄著細細的雨,早上九點一到,辦公室的門準時打開了,飛哥把微沾著雨露的公事包稍微擦拭了下,「鈴----鈴----」一陣急促的電話鈴響劃破了寧靜的工作室。

「嘿yo! 飛sir,我是B董! Long time no see,最近我們公司成立了不少新部門啊,有好多資料等著你協助分析呢! 哈哈哈!」電話那頭傳來一個笑聲爽朗的聲音。

「OH! 好久不見啊! 阿倫兄! 上次爬完雪山後就好久沒聯絡,想不到轉眼間你就升上董事長啦!」飛哥難掩喜悅的表情,神采奕奕地說著。

「哪有你那麼自由,還可以到處飛來飛去,哈哈哈,我整天在公司忙上忙下都快喘不過來了。」B董苦笑著。

「我就直接切進主題了啊,我這邊有幾個不同部門的人要請你協助下,想先問你通常有哪些回歸手法可以用啊?」稍作閒聊後,B董很快地進入狀況。

飛哥思考了下,不疾不徐地開始說明:「基本上,模型我會分為三大類,分別是『連續型』、『類別型』、『計數型』,這邊所說的類型就是以應變數Y來分類,對應到的回歸模型就是『一般線性回歸』、『羅吉斯回歸』、『卜瓦松回歸』。」

「這三種類型在使用上有甚麼差別嗎?」B董問道。

「『一般線性回歸』就是最常見的回歸模型,假如你想知道員工的學歷對薪水(連續)有無影響、兒童每周運動幾次對身高(連續)的影響,只要你關注的Y是連續的就可以使用這種回歸; 『羅吉斯回歸』主要用在兩種類別的分辨上,像是媽媽懷孕期間的生活習慣導致生男生女(兩種類別)、根據病人的基因表現來判斷有無(兩種類別)得到癌症,我們關注的Y具有二元的特質時,就會使用這種回歸;最後的『卜瓦松回歸』主要應用在Y具有計數的性質時,也就是Y為非負整數,比如十年間非洲每個月感染愛滋病的死亡人數(計數)、在戰區工作的軍人與非戰區工作的軍人在罹癌人數(計數)上的不同。上述模型考慮的因子X都可以放入連續型變數或類別型變數,因此我才會以Y來分類做說明。」說完這一大段,飛哥推了推眼鏡。

https://ithelp.ithome.com.tw/upload/images/20200926/20130640VdVah6opRC.png

B董滿意的點了點頭說道:「挺好的,似乎能根據資料的特性來應付許多不同的狀況啊!過幾天飛來我的公司吧,已經幫你把機票買好啦!」

小博在一旁聽到飛哥又要出差,急忙使了個眼神說自己也想去看看。飛哥笑著點頭跟B董說:「再多幫我準備張機票吧! 最近我招了個助理,一起去見識見識。」

「沒問題!哈哈哈!那兩天後新加坡見啦!掰!」B董迅速的掛了電話。

窗外的雨持續地下著,飛哥往窗外凝視了下,心中暗想:「希望這次出國時別下著雨啊!」

-----------------------------------------------------------------------------------------------------

後記:飛哥與小博兩人又要出國啦! 想想武漢肺炎導致大家今年無法出國遊玩,就跟著劇情的人物一起出遊吧! 雖然不是特別詳細的旅遊介紹文,但裡面的景點還是可以在疫情解除後參考看看~~~


上一篇
[DAY 10] 章節2-6: 炭烤雞排的力量-假設檢定(Python+解說)
下一篇
[DAY 12] 章節2-8: 安眠藥的極限-一般線性回歸(Python)
系列文
飛哥與小博的30天-統計與機器學習成長日記30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言